"""
@Time ： 2022/11/26 10:47
@Auth ： 陈杰 200320501042
@E-mail : 1612845322@qq.com
"""
import re
#以
file = open("data/data07_04.txt", "r", -1, "utf-16")
s = file.read()  # 读取全部内容
print("全部内容：", s)
pattern = re.compile("[A-Za-z]")  # 查找英文内容
en = "".join(pattern.findall(s))
print("英文内容：", en)
pattern = re.compile("[\u4e00-\u9fa5]")  # 查找中文内容
cn = "".join(pattern.findall(s))
print("中文内容：", cn)
print("-" * 56)
file.close()
# UTF-16:使用2、4个字节表示所有字符：优先使用2个字节，否则使用4个字节表示。
file = open("data/data07_04.txt", "r", -1, "utf-16")
s = file.read(9)  # 读取9个字节，1中文占2字节，2英文占1字节
print("前6个字符：", s)
s = file.read()  # 读取剩余内容
print("剩余内容：", s)
file.close()